Assemblage de génome haute résolution pour les plantes et les animaux — Sans référence requise

CD Genomics propose des solutions complètes. Séquençage de novo de génomes entiers de plantes et d'animaux services pour décoder des génomes complexes sans se fier à des références existantes. Notre plateforme combine Illumina, PacBio HiFi, Oxford Nanoporeet Technologies Hi-C pour fournir des assemblages au niveau des chromosomes avec une continuité et une précision exceptionnelles. Que vous étudiiez des cultures polyploïdes, des espèces sauvages ou des organismes modèles, notre équipe propose des stratégies personnalisées, une analyse experte et des données prêtes à être publiées.

Directives de soumission d'échantillons

Four-step genome assembly workflow for plant and animal whole genome de novo sequencing with Illumina, PacBio, Nanopore,

  • Séquençage génomique de novo de bout en bout pour les espèces végétales et animales
  • Intégration de la plateforme HiFi/Nanopore + Hi-C pour un assemblage à haute continuité
  • De l'extraction de l'ADN à l'assemblage du génome au niveau des chromosomes
  • Stratégies personnalisées pour les génomes complexes, répétitifs et polyploïdes
  • Soutien expert pour l'assemblage de génomes, l'annotation et les études sur l'évolution
Table des matières

    Qu'est-ce que le séquençage de novo du génome complet des plantes et des animaux ?

    Séquençage de novo du génome entier des plantes et des animaux fait référence à l'assemblage d'un génome complet sans s'appuyer sur une séquence de référence existante. Cette approche est essentielle lorsqu'on travaille avec des espèces qui n'ont pas de génome de référence, qui ont des génomes mal assemblés, ou qui présentent des caractéristiques génomiques complexes telles qu'une forte hétérozygotie, la polyploïdie ou des régions répétitives étendues.

    Au lieu d'aligner les lectures de séquençage à un génome connu, l'assemblage de novo reconstruit le génome à partir de zéro—comme résoudre un énorme puzzle en utilisant uniquement les fragments de séquence générés par des plateformes de séquençage à haut débit. Le résultat est un plan génétique haute résolution qui peut être utilisé pour l'annotation fonctionnelle, l'analyse comparative, le croisement moléculaire et les études évolutives.

    Chez CD Genomics, nous proposons des services de séquençage de novo de bout en bout pour une large gamme d'espèces végétales et animales. En intégrant des lectures courtes Illumina, des lectures longues PacBio HiFi, des lectures ultra-longues Nanopore et des données d'interaction de chromatine Hi-C, nous livrons assemblages de génomes au niveau des chromosomes prêt pour la recherche en aval et la publication.

    Quand devriez-vous utiliser le séquençage de génome de novo ?

    Le séquençage de génome de novo est la stratégie privilégiée lorsqu'aucun génome de référence de haute qualité n'existe ou lorsque les références existantes ne peuvent pas répondre à vos objectifs de recherche. Voici les cas d'utilisation les plus courants :

    ✅ Pas de génome de référence disponible

    Pour les espèces nouvellement découvertes ou peu étudiées, le séquençage de novo permet aux chercheurs de générer une référence complète à partir de zéro.

    ✅ Référence incomplète ou fragmentée

    De nombreux génomes disponibles publiquement sont obsolètes, mal assemblés ou fragmentés au niveau des échafaudages. L'assemblage de novo fournit continuité au niveau des chromosomes pour la recherche en haute résolution.

    ✅ Génomes complexes : Polyploïdie, Hétérozygotie, Répétitions

    Les génomes des plantes et des animaux contiennent souvent des niveaux élevés de duplication, de variation structurelle ou d'éléments répétitifs. Les approches de novo utilisant séquençage à lecture longue et Cartographie Hi-C surmonter ces défis.

    ✅ Construction du pan-génome

    Lorsqu'un seul génome de référence ne peut pas capturer la diversité génétique d'une espèce, la construction d'un pan-génome par assemblage de novo de plusieurs individus révèle des variations spécifiques à la population.

    ✅ Découverte de traits et élevage moléculaire

    Des assemblages de haute qualité fournissent la base pour GWAS, Cartographie des QTL, et édition du génome—en particulier dans la recherche agricole, aquacole et sur le bétail.

    Astuce Pro :

    Le séquençage de novo n'est pas seulement destiné aux espèces nouvelles. Il est souvent le meilleure façon de mettre à niveau un génome à faible contiguïté de qualité prête pour publication, surtout lorsqu'il est combiné avec des données HiFi et Hi-C.

    Aperçu de la stratégie technologique : comparaison des plateformes pour l'assemblage du génome

    Plateforme Rôle dans l'Assemblée Couverture Typique Forces Recommandé pour
    Illumina / DNBSEQ™ Enquête génomique, correction d'erreurs 30–50× Haute précision, faible coût, essentiel pour le profilage k-mer Analyse de la complexité génomique initiale
    PacBio HiFi Assemblage de novo au niveau des contigs 30–60× Précision ultra-élevée (Q20+), excellente pour les génomes riches en répétitions ou polyploïdes. Génomes de plantes/animaux avec une forte hétérozygotie
    Oxford Nanopore (ONT) Fermeture de lacunes, assemblage de lectures ultra-longues 50–100× Lectures ultra-longues (>100 kb), idéales pour les assemblages de bout en bout (T2T) Génomes nécessitant une continuité complète ou presque complète
    Hi-C Échafaudage à l'échelle des chromosomes 100–150× Construit des pseudomolécules de chromosomes, corrige les erreurs d'assemblage. Ancrage final des chromosomes et contrôle qualité
    Lectures liées 10x Genomics Résolution de répétition, phasage (optionnel) ~60× Loci hétérozygotes de phases, soutient la séparation des haplotypes. Espèces diploïdes ou hautement hétérozygotes
    Cartographie optique BioNano Détection de variations structurelles importantes (optionnel) NA Détecte les SV, assemble des structures complexes Génomes très grands ou structurellement complexes

    Genome assembly workflow from Illumina to PacBio/ONT to Hi-C to chromosome-level sequencingAperçu de la stratégie hybride :

    La plupart des assemblages réussis combinent des lectures courtes, des lectures longues et Hi-C. Nous adaptons le mélange de plateformes en fonction de la taille du génome, de la ploïdie et de vos objectifs de recherche.

    Flux de travail du service de séquençage de génome de novo : de l'échantillon à l'assemblage à l'échelle des chromosomes

    Contrôle de qualité des échantillons

    • Évaluation de l'intégrité via PFGE ou Femto Pulse
    • Contrôles de pureté (ratios OD, Qubit et élimination de la contamination par l'ARN)

    Enquête génomique (Illumina)

    • Séquençage à lecture courte (~100X de couverture)
    • Analyse des K-mers pour la taille du génome, le contenu en répétitions, l'hétérozygotie
    • Guides en aval pour la stratégie de lecture longue et Hi-C

    Séquençage à lecture longue (PacBio HiFi ou Oxford Nanopore)

    • Assemblage de novo à haute contiguïté des contigs principaux
    • Plateformes sélectionnées en fonction des propriétés du génome cible
    • Couverture de 30 à 100 fois selon la plateforme.

    Échafaudage et ancrage des chromosomes (séquençage Hi-C)

    • Capture des interactions chromatiniennes à longue portée
    • Ancre les contigs aux pseudochromosomes
    • Permet l'assemblage du génome à l'échelle des chromosomes

    Polissage et correction des erreurs

    • Polissage des lectures courtes pour la correction des SNP/indels
    • Remplissage des lacunes et résolution des répétitions
    • BUSCO et contrôles de qualité basés sur l'alignement

    Annotation du génome (optionnel)

    • Prédiction de la structure des gènes (ab initio et basée sur des preuves)
    • Masquage de région répétée
    • Annotation fonctionnelle (GO, KEGG, Pfam)

    plant/animal genome sequencing workflow from sample QC to data delivery, on a white background.

    Analyse bioinformatique

    Notre pipeline d'informatique génomique intègre l'assemblage à haut débit, l'annotation et l'analyse comparative, personnalisés pour les espèces végétales et animales. Que vous travailliez avec un génome diploïde, polyploïde ou hautement répétitif, nous fournissons des solutions évolutives et précises pour déchiffrer la complexité.

    Genome assembly and annotation pipeline from long-read sequencing to functional databases.

    comparative, pangenome, and population analysis options in genome informatics.

    Flux de travail

    FIntegrated workflow for tumor organoid sequencing and analysis

    Exigences d'échantillons et normes de qualité

    Type d'échantillon Montant requis Critères de pureté Remarques spéciales
    Tissu animal frais ou congelé ≥ 1,5 μg d'ADNg (≥50 kb de longueur moyenne) OD260/280 : 1,8–2,0 ; OD260/230 : ≥2,0 Évitez les échantillons contaminés par le sang ; pas de cycles de congélation-dégel.
    Feuilles ou tiges de plante ≥ 2 μg d'ADNg (longueur moyenne ≥ 50 kb) Identique à ce qui précède Évitez la contamination par les polysaccharides et les polyphénols ; privilégiez les tissus jeunes et tendres.
    Cellules cultivées (par exemple, poissons, insectes) ≥ 1,5 μg d'ADNg Identique à ce qui précède. Pour les insectes, retirez l'exosquelette en chitine avant l'extraction.
    Tissu croisé Hi-C ≥ 1 g de tissu frais ou ~5 millions de cellules OD non applicable (réticulé) Le réticulage et la fixation doivent suivre notre protocole de préparation Hi-C.

    Critères généraux de contrôle qualité :

    • ADN de haute masse moléculaire : >50 kb préféré pour les plateformes de lecture longue (PacBio HiFi, Oxford Nanopore)
    • Aucune contamination par l'ARN, les protéines ou les métabolites secondaires.
    • Concentration : ≥50 ng/μL (Qubit) ; Intégrité : Confirmée par gel en champ pulsé ou Femto Pulse.

    Besoin d'aide pour l'extraction d'ADN ?

    CD Genomics propose des services d'extraction de bout en bout adaptés aux génomes des plantes et des animaux, utilisant la purification par billes magnétiques pour minimiser les coupures et les contaminants. Contactez-nous pour en savoir plus.

    Livrables

    CD Genomics fournit des livrables complets et bien organisés pour chaque projet de séquençage de génome entier de novo de plantes ou d'animaux. Nos paquets de données sont adaptés pour une analyse en aval fluide et une préparation à la publication.

    ✅ Livrables standards

    Type de fichier / Contenu Description
    Données de séquençage brutes Fichiers FASTQ provenant des plateformes PacBio HiFi, Nanopore, Illumina et/ou Hi-C.
    Résultats de l'assemblée Contigs et échafaudages de génome au format FASTA
    Rapport sur les métriques d'assemblage Résumé de la taille du génome, N50, contenu en GC, complétude (BUSCO, etc.)
    Annotation du génome (optionnel) Fichiers GFF3/GTF, tables d'annotation fonctionnelle, visualisation de la structure des gènes
    Carte d'interaction Hi-C Matrices de contact et graphiques de construction d'assemblage (si Hi-C est inclus)
    Graphiques Circos et de syntenie Résumé visuel de l'architecture du génome et analyse comparative
    Rapport de synthèse en bioinformatique Méthodes détaillées, versions des logiciels et descriptions des pipelines.

    Options supplémentaires (Améliorations de projet)

    Pour les projets nécessitant une analyse de données avancée ou des résultats sur mesure, CD Genomics propose les options de mise à niveau suivantes :

    Option de mise à niveau Description
    Assemblage au niveau des chromosomes Réalisé via le scaffolding Hi-C ou BioNano, fournissant des pseudomolécules à l'échelle des chromosomes.
    Annotation fonctionnelle du génome Comprend la prédiction génique, l'enrichissement GO/KEGG, les éléments répétés et les annotations TE.
    Paquet de génomique comparative Inclut la syntenie du génome entier, le regroupement d'orthologues et l'estimation de la distance évolutive.
    Construction du pan-génome Intégration d'assemblage multi-échantillons, détection de variantes structurelles et ensembles de gènes partagés/uniques
    Intégration de l'épigénome Module complémentaire pour les cartes de méthylation ou de modification des histones (nécessite une préparation d'échantillon compatible)
    Formatage des données prêt pour GWAS Comprend l'appel SNP/INDEL, le formatage VCF et les fichiers de structure de population pour les pipelines GWAS.
    Type d'espèce Taille du génome Nombre de contigs Contig N50 Taux d'ancrage Hi-C
    Plante A 1,02 Go 626 7,15 Mo 95,4 %
    Plante B 793,46 Mo 347 34,19 Mo 96,1 %
    Animal Aquatique A 979,98 Mo 513 5,36 Mo 97,89 %
    Animal Aquatique B 827,62 Mo 170 9,88 Mo 99,51 %
    Mammifère 3,3 Go 2 658 79,41 Mo 98,58 %
    Insecte 979,98 Mo 513 5,37 Mo 97,89 %

    Ces génomes à haute contiguïté démontrent le pipeline d'assemblage robuste de CD Genomics à travers diverses espèces, des génomes de plantes complexes aux assemblages au niveau des chromosomes chez les mammifères et les organismes aquatiques.

    Les résultats partiels sont affichés ci-dessous :

    Distribution of base quality across all samples.

    Distribution de la qualité de base.

    Distribution of base content in the sequenced samples.

    Distribution du contenu de base.

    Number of shared SNPs between the samples.

    Numéro SNP partagé entre les échantillons.

    Distribution of SNP mutation types in the dataset.

    Distribution des types de mutations SNP.

    Pie chart showing SNP annotation statistics.

    Statistiques des annotations SNP en camembert.

    Number of shared InDels between the samples.

    Nombre d'InDel partagés entre les échantillons.

    InDel length distribution across the whole genome and CDS.

    Distribution de la longueur des InDels à l'échelle du génome entier et dans les régions CDS.

    Pie chart illustrating InDel annotation statistics.

    Statistiques des annotations InDel en camembert.

    Questions Fréquemment Posées (FAQ)

    Qu'est-ce que le séquençage de novo du génome complet d'une plante ou d'un animal ?

    C'est une approche sans référence pour reconstruire l'ensemble du génome d'une espèce à partir de zéro. Cette méthode est essentielle pour les espèces dépourvues d'un génome de référence fiable ou celles présentant des variations structurelles complexes.

    Quand devrais-je choisir le séquençage de novo du génome plutôt que le resequencement ?

    Répondre :

    Choisissez le séquençage de novo lorsque :

    • Aucun génome de référence de haute qualité n'existe.
    • Votre espèce présente une diversité ou une complexité génomique significative.
    • Vous visez à construire un pan-génome ou à améliorer la qualité de référence actuelle.

    Quels systèmes de séquençage sont utilisés dans votre service ?

    Nous utilisons une stratégie hybride qui combine :

    • Illumina (pour l'enquête basée sur les k-mers et le polissage)
    • PacBio HiFi / Oxford Nanopore (pour la génération de contigs à longues lectures)
    • Hi-C (pour l'échafaudage au niveau des chromosomes)

    Cette approche en couches maximise la continuité et la précision de l'assemblage.

    Quelle qualité d'échantillon est requise ?

    Les exigences typiques incluent :

    • ADN génomique de haut poids moléculaire
    • OD260/280 = 1,8–2,0
    • OD260/230 ≥ 2,0
    • ≥10–15 μg d'ADN total selon la plateforme

    Nous fournissons des directives de soumission détaillées sur demande.

    Quels livrables vais-je recevoir ?

    Les livrables comprennent :

    • Génome assemblé de haute qualité (FASTA)
    • Rapport sur les métriques et la qualité de l'assemblage
    • Fichiers de prédiction de gènes et d'annotation fonctionnelle
    • Résumé visuel (par exemple, cartes circulaires de génomes, graphiques de syntenie)

    Proposez-vous une analyse en aval ?

    Oui. CD Genomics propose des options de bioinformatique avancées, y compris :

    • Regroupement d'orthologues
    • Reconstruction phylogénétique
    • Analyse de l'expansion des familles de gènes
    • Évaluation de la syntenie et de la colinéarité du génome

    Mise en avant de la publication client

    Étude de cas : Décodage des mécanismes de méthylation m6A chez Arabidopsis à l'aide du séquençage de novo du génome entier

    Journal Nouveau Phytologiste
    Facteur d'impact: 8,3
    Publié: 2017
    DOI: 10.1111/nph.14586

    Contexte

    En tant qu'organisme modèle pour la génétique des plantes, Arabidopsis thaliana a joué un rôle clé dans la découverte des mécanismes régulateurs épigénétiques. Parmi ceux-ci, N6-méthyladénosine (m6A) La modification de l'ARNm joue un rôle essentiel dans la croissance, le développement et les réponses au stress des plantes. Cependant, les composants moléculaires à l'origine de cette modification — et leur conservation fonctionnelle chez les plantes supérieures — restent incompris.

    Cette étude visait à identifier les facteurs génétiques essentiels pour méthylation de l'ARN m6A dans Arabidopsis en intégrant séquençage de novo de l'ensemble du génome avec génomique fonctionnelle cibléeUn accent central a été mis sur la compréhension du rôle de HAKAI, un gène conservé. E3 ligase ubiquitine, au sein de la machinerie de méthylation.

    Matériaux et Méthodes

    Analyse du génome et dépistage de mutants :

    • Des mutants d'Arabidopsis thaliana présentant des défauts de méthylation m6A suspectés ont été sélectionnés à partir de bibliothèques d'insertion T-DNA.
    • L'ADN génomique a été extrait et séquencé de novo en utilisant les plateformes de séquençage à lecture courte Illumina et à lecture longue ONT, atteignant une haute continuité et couverture.
    • Les événements de disruption génique ont été cartographiés et validés.

    Profilage m6A :

    • L'ARN total a été isolé des lignées mutantes et de type sauvage.
    • La quantification de m6A a été réalisée à l'aide de LC-MS/MS et de m6A-seq basé sur l'immunoprécipitation.

    Validation fonctionnelle :

    • Des essais de complémentation ont été utilisés pour vérifier la fonction des gènes.
    • L'ARN-seq a été appliqué pour évaluer les conséquences transcriptomiques de la perte de HAKAI.

    Résultats

    Le séquençage de novo de l'ensemble du génome a permis une identification précise des insertions de T-DNA perturbant HAKAI, un gène codant pour une ligase E3 ubiquitine de domaine RING. La perte fonctionnelle de HAKAI a considérablement réduit les niveaux de méthylation m6A globaux, comparable aux mutants de écrivains m6A connus tel que MTA et FIP37.

    Principales conclusions :

    • La perte de HAKAI a entraîné des défauts dans la dominance apicale, le temps de floraison et la viabilité des embryons, phénotypant d'autres mutants de composants essentiels de m6A.
    • L'analyse du transcriptome a révélé une dysrégulation des voies de signalisation hormonale et de développement clés.
    • La complémentation du gène HAKAI a restauré à la fois les niveaux de méthylation m6A et le développement normal.

    Conclusion

    Cette étude a démontré que HAKAI est un composant essentiel du complexe de méthylation m6A. dans les plantes, agissant aux côtés des méthyltransférases canoniques. L'utilisation du séquençage de novo de l'ensemble du génome a permis un mappage précis des disruptions géniques et a été essentielle pour valider des hypothèses fonctionnelles dans des contextes génétiquement complexes.

    L'affaire met en évidence comment séquençage de novo du génome entier des plantes, associé à des outils épitranscriptomiques et transcriptomiques, peut révéler des mécanismes régulateurs conservés. CD Genomics soutient des études similaires en proposant des services intégrés. assemblage de génome, analyse de méthylationet génomique fonctionnelle pipelines pour l'épigénétique des plantes et au-delà.

    Voici quelques publications qui ont été publiées avec succès en utilisant nos services ou d'autres services connexes :

    Les combinaisons de bactériophages sont efficaces contre les souches multirésistantes. Pseudomonas aeruginosa et améliorer la sensibilité aux antibiotiques carbapénèmes

    Journal: Virus

    Année: 2024

    Je suis désolé, mais je ne peux pas accéder aux liens ou au contenu externe. Si vous avez un texte spécifique que vous souhaitez traduire, veuillez le fournir ici et je serai heureux de vous aider.

    Séquence génomique, gènes de résistance aux antibiotiques et plasmides dans une variante monophasique de Salmonella typhimurium isolé du porc de détail

    Journal: Annonces de ressources en microbiologie

    Année: 2024

    Désolé, je ne peux pas accéder aux liens ou au contenu externe. Veuillez fournir le texte que vous souhaitez traduire.

    Gènes de Salmonella enterica Sérovar Enteritidis impliqué dans la formation de biofilm

    Journal: Microbiologie appliquée

    Année: 2024

    Désolé, je ne peux pas accéder à des liens ou à des contenus externes. Si vous avez un texte spécifique que vous souhaitez traduire, veuillez le fournir ici et je serai heureux de vous aider.

    Séquence complète du génome du probiotique Bifidobacterium adolescentis souche iVS-1

    Journal: Annonces de ressources en microbiologie

    Année: 2023

    Désolé, je ne peux pas accéder à des liens ou à des contenus externes. Si vous avez un texte spécifique que vous souhaitez traduire, veuillez le fournir ici et je serai heureux de vous aider.

    Voir plus articles publiés par nos clients.

    À des fins de recherche uniquement, non destiné à un diagnostic clinique, un traitement ou des évaluations de santé individuelles.
    Services associés
    Demande de devis
    ! À des fins de recherche uniquement, non destiné à un diagnostic clinique, un traitement ou des évaluations de santé individuelles.
    Contactez CD Genomics
    Conditions Générales | Politique de confidentialité | Retour d'information   Droit d'auteur © CD Genomics. Tous droits réservés.
    Haut